智能论文笔记

Shapley value-based approaches to explain the robustness of classifiers in machine learning

Guilherme Dean Pelegrina , Sajid Siraj

分类：机器学习 | 人工智能

2022-09-09

在机器学习中，使用算法 - 不足的方法是一个新兴领域，用于解释单个特征对预测结果的贡献。尽管重点放在解释预测本身上，但已经做了一些解释这些模型的鲁棒性，即每个功能如何有助于实现这种鲁棒性。在本文中，我们建议使用沙普利值来解释每个特征对模型鲁棒性的贡献，该功能以接收器操作特性（ROC）曲线和ROC曲线（AUC）下的面积来衡量。在一个说明性示例的帮助下，我们证明了解释ROC曲线的拟议思想，并可以看到这些曲线中的不确定性。对于不平衡的数据集，使用Precision-Recall曲线（PRC）被认为更合适，因此我们还演示了如何借助Shapley值解释PRC。

translated by 谷歌翻译

Person Monitoring by Full Body Tracking in Uniform Crowd Environment

Zhibo Zhang , Omar Alremeithi , Maryam Almheiri , Marwa Albeshr , Xiaoxiong Zhang , Sajid Javed , Naoufel Werghi

分类：计算机视觉

2022-09-02

全身追踪器用于监视和安全目的，例如人跟踪机器人。在中东，统一的人群环境是挑战最新跟踪器的常态。尽管过去文献中记录的跟踪器技术有了很大的改进，但这些跟踪器尚未使用捕获这些环境的数据集进行了培训。在这项工作中，我们在统一的人群环境中开发了一个带有一个特定目标的注释数据集。该数据集是在四种不同的情况下生成的，在四种不同的情况下，目标主要是与人群一起移动，有时会与它们阻塞，而其他时候，相机的目标视图在短时间内被人群阻止。注释后，它用于评估和微调最新的跟踪器。我们的结果表明，与初始预训练的跟踪器相比，基于两个定量评估指标的微调跟踪器在评估数据集上的性能更好。

translated by 谷歌翻译

Learning Branched Fusion and Orthogonal Projection for Face-Voice Association

Muhammad Saad Saeed , Shah Nawaz , Muhammad Haris Khan , Sajid Javed , Muhammad Haroon Yousaf , Alessio Del Bue

分类：计算机视觉

2022-08-22

近年来，人们对建立面孔和名人声音之间的关联的兴趣越来越大，从而利用YouTube的视听信息。先前的工作采用公制学习方法来学习适合关联匹配和验证任务的嵌入式空间。尽管显示出一些进展，但由于依赖距离依赖的边缘参数，运行时训练的复杂性差以及对精心制作的负面采矿程序的依赖，这种制剂是限制性的。在这项工作中，我们假设一个丰富的表示形式以及有效但有效的监督对于实现面部voice关联任务的歧视性关节嵌入空间很重要。为此，我们提出了一种轻巧的插件机制，该机制利用这两种方式中的互补线索以通过正交性约束来根据其身份标签形成丰富的融合杂物并将其簇形成。我们将我们提出的机制作为融合和正交投影（FOP）创造，并在两个流网络中实例化。在Voxceleb1和Mav-Celeb数据集上评估了总体结果框架，其中包括许多任务，包括跨模式验证和匹配。结果表明，我们的方法对当前的最新方法有利，而我们提出的监督表述比当代方法所采用的方法更有效。此外，我们还利用跨模式验证和匹配任务来分析多种语言对面部声音协会的影响。代码可用：\ url {https://github.com/msaadsaeed/fop}

translated by 谷歌翻译

Graph CNN for Moving Object Detection in Complex Environments from Unseen Videos

Jhony H. Giraldo , Sajid Javed , Naoufel Werghi , Thierry Bouwmans

分类：计算机视觉

2022-07-13

移动对象检测（MOD）是许多计算机视觉应用程序的基本步骤。当从静态或移动的摄像机捕获的视频序列遇到挑战时，MOD变得非常具有挑战性：伪装，阴影，动态背景和照明变化，仅举几例。深度学习方法已成功地应用于竞争性能。但是，为了解决过度拟合的问题，深度学习方法需要大量标记的数据，这是一项艰巨的任务，因为始终无法提供详尽的注释。此外，某些MOD深度学习方法显示了在看不见的视频序列存在下的性能下降，因为在网络学习过程中涉及相同序列的测试和训练分裂。在这项工作中，我们使用图形卷积神经网络（GCNN）提出了MOD作为节点分类问题的问题。我们的算法被称为GraphMod-NET，包括实例分割，背景初始化，特征提取和图形结构。在看不见的视频上测试了GraphMod-NET，并且在无监督，半监督和监督的学习中，在2014年变更检测（CDNET2014）和UCSD背景减法数据集中的最先进方法进行了测试。

translated by 谷歌翻译

Breast Cancer Classification using Deep Learned Features Boosted with Handcrafted Features

Unaiza Sajid , Dr. Rizwan Ahmed Khan , Dr. Shahid Munir Shah , Dr. Sheeraz Arif

分类：计算机视觉 | 机器学习

2022-06-26

乳腺癌是全球女性死亡的主要原因之一。如果在高级阶段检测到很难治疗，但是，早期发现可以显着增加生存机会，并改善数百万妇女的生活。鉴于乳腺癌的普遍流行，研究界提出早期检测，分类和诊断的框架至关重要。与医生协调的人工智能研究社区正在开发此类框架以自动化检测任务。随着研究活动的激增，加上大型数据集的可用性和增强的计算能力，预计AI框架结果将有助于更多的临床医生做出正确的预测。在本文中，提出了使用乳房X线照片对乳腺癌进行分类的新框架。所提出的框架结合了从新颖的卷积神经网络（CNN）功能中提取的强大特征，以及手工制作的功能，包括猪（定向梯度的直方图）和LBP（本地二进制图案）。在CBIS-DDSM数据集上获得的结果超过了技术状态。

translated by 谷歌翻译

Neuromorphic Camera Denoising using Graph Neural Network-driven Transformers

Yusra Alkendi , Rana Azzam , Abdulla Ayyad , Sajid Javed , Lakmal Seneviratne , Yahya Zweiri

分类：计算机视觉 | 机器人

2021-12-17

神经形态的愿景是一种生物启发技术，它已经引发了计算机视觉界的范式转变，并作为众多应用的关键推动器。该技术提供了显着的优势，包括降低功耗，降低处理需求和通信加速。然而，神经形态摄像机患有大量的测量噪声。这种噪声恶化了基于神经形态事件的感知和导航算法的性能。在本文中，我们提出了一种新的噪声过滤算法来消除不代表观察场景中的实际记录强度变化的事件。我们采用图形神经网络（GNN） - 驱动的变压器算法，称为GNN变换器，将原始流中的每个活动事件像素分类为实木强度变化或噪声。在GNN中，传递一个名为EventConv的消息传递框架，以反映事件之间的时空相关性，同时保留它们的异步性质。我们还介绍了在各种照明条件下生成事件流的近似地面真理标签（KogT1）方法。 Kogtl用于生成标记的数据集，从记录在充满挑战的照明条件下进行的实验。这些数据集用于培训和广泛测试我们所提出的算法。在取消检测的数据集上测试时，所提出的算法在过滤精度方面优于现有方法12％。还对公共数据集进行了额外的测试，以展示在存在照明变化和不同运动动态的情况下所提出的算法的泛化能力。与现有解决方案相比，定性结果验证了所提出的算法的卓越能力，以消除噪音，同时保留有意义的场景事件。

translated by 谷歌翻译

Towards More Effective PRM-based Crowd Counting via A Multi-resolution Fusion and Attention Network

Usman Sajid , Guanghui Wang

分类：计算机视觉

2021-12-17

本文侧重于改善基于人群计数的最近的即插即用补丁重新分校模块（PRM）方法。为了充分利用PRM潜力，并获得更具可靠和准确的结果，以满足人群变异，大的视角，极端闭塞和杂乱的背景区域，我们提出了一种基于PRM的多分辨率和多任务人群通过利用更多有效性和效力来计算网络来计算网络。所提出的模型由三个深层分支组成，每个分支都会生成不同分辨率的特征图。这些分支机构互相执行特征级融合，以构建用于最终人群估计的重要集体知识。此外，早期的特征图会经受视觉注意力，以加强对前景地区的后期频道的理解。与PRM模块的这些深度分支的整合和早期的块通过四个基准数据集上的广泛数值和视觉评估而比原始的PRM基础级更有效。拟议的方法在RMSE评估标准方面产生了12.6％的余量。它还优于跨数据集评估中的最先进的方法。

translated by 谷歌翻译

Visual Object Tracking with Discriminative Filters and Siamese Networks: A Survey and Outlook

Sajid Javed , Martin Danelljan , Fahad Shahbaz Khan , Muhammad Haris Khan , Michael Felsberg , Jiri Matas

分类：计算机视觉

2021-12-06

准确且强大的视觉对象跟踪是最具挑战性和最基本的计算机视觉问题之一。它需要在图像序列中估计目标的轨迹，仅给出其初始位置和分段，或者在边界框的形式中粗略近似。判别相关滤波器（DCF）和深度暹罗网络（SNS）被出现为主导跟踪范式，这导致了重大进展。在过去十年的视觉对象跟踪快速演变之后，该调查介绍了90多个DCFS和暹罗跟踪器的系统和彻底审查，基于九个跟踪基准。首先，我们介绍了DCF和暹罗跟踪核心配方的背景理论。然后，我们在这些跟踪范式中区分和全面地审查共享以及具体的开放研究挑战。此外，我们彻底分析了DCF和暹罗跟踪器对九个基准的性能，涵盖了视觉跟踪的不同实验方面：数据集，评估度量，性能和速度比较。通过提出根据我们的分析提出尊重开放挑战的建议和建议来完成调查。

translated by 谷歌翻译

DeepSteal: Advanced Model Extractions Leveraging Efficient Weight Stealing in Memories

Adnan Siraj Rakin , Md Hafizul Islam Chowdhuryy , Fan Yao , Deliang Fan

分类：人工智能 | 计算机视觉 | 机器学习

2021-11-08

深度神经网络（DNN）的最新进步已经看到多个安全敏感域中的广泛部署。需要资源密集型培训和使用有价值的域特定培训数据，使这些模型成为模型所有者的顶级知识产权（IP）。 DNN隐私的主要威胁之一是模型提取攻击，前提是在DNN模型中试图窃取敏感信息。最近的研究表明，基于硬件的侧信道攻击可以揭示关于DNN模型的内部知识（例如，模型架构）但到目前为止，现有攻击不能提取详细的模型参数（例如，权重/偏置）。在这项工作中，我们首次提出了一种先进的模型提取攻击框架，借助记忆侧通道攻击有效地窃取了DNN权重。我们建议的深度包括两个关键阶段。首先，我们通过采用基于Rowhammer的硬件故障技术作为信息泄漏向量，开发一种名为HammerLeak的新重量位信息提取方法。 Hammerleak利用了用于DNN应用的几种新的系统级技术，以实现快速高效的重量窃取。其次，我们提出了一种具有平均聚类重量惩罚的新型替代模型训练算法，其利用部分泄漏的位信息有效地利用了目标受害者模型的替代原型。我们在三个流行的图像数据集（例如，CiFar-10/100 / GTSRB）和四个DNN架构上评估该替代模型提取方法（例如，Reset-18/34 / Wide-Reset / Vgg-11）。提取的替代模型在CiFar-10数据集的深度剩余网络上成功实现了超过90％的测试精度。此外，我们提取的替代模型也可能产生有效的对抗性输入样本来欺骗受害者模型。

translated by 谷歌翻译

Reward Maximisation through Discrete Active Inference

Lancelot Da Costa , Noor Sajid , Thomas Parr , Karl Friston , Ryan Smith

分类：人工智能

2020-09-17

主动推断是建模生物学和人造药物的行为的概率框架，该框架源于最小化自由能的原理。近年来，该框架已成功地应用于各种情况下，其目标是最大程度地提高奖励，提供可比性，有时甚至是卓越的性能与替代方法。在本文中，我们通过演示如何以及何时进行主动推理代理执行最佳奖励的动作来阐明奖励最大化和主动推断之间的联系。确切地说，我们展示了主动推理为Bellman方程提供最佳解决方案的条件 - 这种公式是基于模型的增强学习和控制的几种方法。在部分观察到的马尔可夫决策过程中，标准的主动推理方案可以为计划视野1的最佳动作产生最佳动作，但不能超越。相比之下，最近开发的递归活跃推理方案（复杂的推理）可以在任何有限的颞范围内产生最佳作用。我们通过讨论主动推理和强化学习之间更广泛的关系来补充分析。

translated by 谷歌翻译